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(57) Abstract 
\ 

For coding based on the sequence objects of animated images for video objects, a signalling information is continuously transmitted 
independently of the external form of a video object, said information indicating whether the video object must be decoded for reproduction 
or shown on screen. With respect to an extant solution, fewer data need to be transmitted. 

(57) Zusammenfassung 


Fur die objektbasierte Codierung von Bewegtbildfolgen fiir Videoobjekte wird unabhangig von der auBeren Form eines Videoobjektes 
stets eine Signalisierungsinformation ubertragen, die angibt, ob das Videoobjekt ftir eine Wiedergabe zu decodieren beziehungsweise zur 
Anzeige zu bringen ist. Im Gegensatz zu einer bisherigen Losung mtissen weniger Daten ubertragen werden. 
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Verfahren zur Auf bereitung eines Datenstromes fur die 
10 obiektbasierte Codierung von Bewegtbildf olaen 

Stand der Technik 

Die Erfindung betrifft ein Verfahren zur Aufbereitung eines 
15 Datenstromes fur die objektbasierte Codierung von 

Bewegtbildf olgen, die beliebige Form und GroSe aufweisen. 

Beim MPEG-4 Video Verification Model Version 7.0, Bristol, 
April 1997, MPEG- 97/N 1642, ISO/IEC JTC/SC 29/WG 11 ist ein 

20 Encoder und Decoder zur ob jektbasierten Codierung von 

Bewegtbildf olgen spezif iziert . Dabei werden innerhalb einer 
Videosession (VS) nicht mehr rechteckige Bilder fester GroSe 
codiert und zum Empf anger ubertragen, sondern sogenannte 
Video Objects (VO) , welche beliebige Form und Gr6£e 

25 aufweisen diirfen. Diese Videoobjekte konnen dann weiterhin 

noch in verschiedene Video Object Layer (VOL) unterteilt 
sein, urn z.B. verschiedene Auf losungsstuf en eines 
Videoobjektes darzustellen . Die Abbildung eines VO eines 
bestimmten Layers in der Kamerabildebene zu einem bestimmten 

30 Zeitpunkt wird als Video Object Plane (VOP) bezeichnet. 

Somit ist die Beziehung zwischen VO und VOP Equivalent zu 
der Beziehung zwischen Bildfolge und Bild im Falle der 
Ubertragung rechteckiger Bilder fester GroSe. 
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Die Syntax zur Ubertragung eines VOP spezifiziert zum einen 
die Signalisierung der lokalen Zeitbasis eines VOP. Damit 
wird angegeben, zu welchem Zeitpunkt bezuglich bereits 
vorher ubertragener VOPs der aktuelle VOP zur Anzeige zu 
5 bringen ist . Fig. 1 zeigt den Aufbau der Syntax fur die 

Elemente VS, vo, VOL und der relevanten Teile fur das 
Element VOP . 

Relevant in diesem Zusammenhang sind hier die dargestellten 
10 Teile der Syntax des VOP. Dabei gibt das Element „ modulo 

time base" die lokale Zeitbasis des VOP in Schritten von 
1000 Millisekunden an, das Element „VOP time increment" 
gibt zusatzlich die lokale Zeitbasis in Schritten von l 
Millisekunde an. Das Element „VOP prediction type" gibt an, 
15 welche Art von Pradiktion fur den VOP verwendet werden soil. 

Hier gibt es vier Moglichkeiten : I -VOP, d.h. es wird keine 
Pradiktion verwendet, P-VOP, d.h. die Pradiktion wird aus 
dem zeitlich vorhergehenden VOP vorgenommen, B-VOP, d.h. die 
Pradiktion wird aus dem zeitlich vorhergehenden und dem 
20 zeitlich folgenden VOP vorgenommen sowie der Fall S-VOP, bei 

dem die Pradiktion aus einem sogenannten SPRITE-VOP 
vorgenommen wird, welcher entweder zu Beginn der Video- 
Session einmalig ubertragen oder wahrend der Ubertragung aus 
den rekonstruierten Daten gewonnen wird. 

25 

Zusatzlich zur Ubertragung der lokalen Zeitbasis eines VOP 
spezifiziert die Syntax eine Moglichkeit zur Signalisierung 
des Zustandes „codiert /nicht codiert" fur ein VOP. Dabei 
werden fur den VOP im Falle des Zustandes „ nicht codiert" 
30 nach den entsprechenden Signalisierungselementen keine 

weiteren Daten ubertragen und es wird die Ubertragung eines 
neuen VOP begonnen, sofern vorhanden. Auf der Empf angerseite 
wird ein „nicht codierter" VOP nicht weiter decodiert und 
nicht zur Anzeige gebracht . 
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Hierbei gibt das Element „ video object layer shape" , 
welches im Bereich Headerlnfo der Syntax des zugehorigen VOL 
spezifiziert ist, an, ob es sich bei dem VO um ein 
rechteckiges VO (== O) oder um ein VO beliebiger GroJSe und 
Form O) handelt . Fur den Fall eines VO beliebiger Grofie 
und Form wird dann mit Hilfe des Elementes „VOP width" die 
Breite des das VOP umgebenden Rechtecks angegeben. Ist diese 
Breite auf den Wert O gesetzt, so signalisiert dies, da£ der 
VOP den Zustand „nicht codiert" hat. Es wird dann die 
Ubertragung der Daten des aktuellen VOP abgebrochen und mit 
der Ubertragung des nachsten VOP begonnen. 

Vorteile der Erf indung 

Mit den MaSnahmen der Erfindung ist es moglich weniger Daten 
fur ein nichtcodiertes Videoobjekts zu ubertragen, d.h. fur 
ein Videoobjekt, das nicht unmittelbar zur Anzeige zu 
bringen ist. Im Unterschied zum vorgenannten Stand der 
Technik ist die Verwendung eines eindeutigen Elements zur 
Signalisierung des Zustandes, ob ein Videoobjekt zur Anzeige 
zu bringen ist oder nicht einfacher und iibersichtlicher . 

Mit dem Verfahren nach der Erfindung ist es moglich, auch 
fur rechteckige VOs den Zustand codiert/nicht codiert zu 
ubertragen und somit zu signalisieren, was bei der 
Realisierung nach dem Stand der Technik nicht moglich ist. 

Die Signalisierungsinf ormation, die angibt, ob ein 
Videoobjekt codiert oder nicht codiert ist, kann der lokalen 
Zeitbasisinf ormation im Datenstrom vor- oder nachgestellt 
sein. Bei der Voranstellung der Signalisierungsinf ormation 
rmissen fur einen nicht codierten VOP noch weniger Daten 
ubertragen werden als bei der Einfiigung der 

Signalisierungsinf ormation nach der lokalen Zeitbasis, da in 
diesem Falle die lokale Zeitbasisinf ormation nicht 


BERICHTIGTES BLATT (REGEL 91) 
ISA/EP 


WO 99/09749 PCT/DE98/02132 

- 4 - 


ubertragen wird. Allerdings ist in diesem Falle das 
„Ausblenden" , d.h. die Unterdruckung der Anzeige eines 
Videoobjektes, nicht mehr zu einem ganz speziellen Zeitpunkt 
moglich, sondern nur noch zu dem auf den Empfang des nicht 
5 codierten VOPs nachstf olgenden Zeitpunkt, zu dem beim 

Empf anger ein Bild zur Anzeige gebracht wird. 

Beschreibung von Ausf iihrungsbeispielen 

10 In Fig. 2 ist der Aufbau des Datenstromes fur die 

Ubertragung von Videoobjekten dargestellt. Zu Beginn (erste 
Zeile des Diagramms) wird das Element „ video session start 
code" iibertragen und anschlie£end die Informationen fur die 
Videoobjekte 1, 2 n. Am Schlufc erscheint der „ video 

15 session end code" . In der zweiten Zeile ist der Aufbau des 

Ubertragungsf ormates fur das „ video object 1" dargestellt. 
Es beginnt mit dem „ video object start code" gefolgt von 
der „ video object identification" und den Elementen fur die 
„ video object layers" 1 bis n. Ein einzelnes Element „ video 

20 object layer" ist in seinem Aufbau in der dritten Zeile 

dargestellt. Es beginnt mit dem „ video object layer start 
code" gefolgt von der „video object layer identification" , 
dem „HeaderInf o" und den Elementen 1 bis n, fur die „Video 
Object Plane" . In der vierten Zeile ist der Aufbau eines 

25 Einzelelementes „ Video Object Plane" dargestellt. Es 

beginnt mit dem „V0P start code" , gefolgt von der lokalen 
Zeitbasisinf ormation „ modulo time base" und dem Element 
„modulo time increment" .Dieser Aufbau stimmt soweit mit dem 
Aufbau gemafc Fig. 1 uberein. In Abweichung zu Fig. l wird 

3 0 aber nun erf indungsgemaS stets ein neues Element in Form 

einer Signalisierungsinf ormation in den Datenstrom 
eingefugt, das angibt, ob das Videoobjekt fur die Wiedergabe 
zu decodieren beziehungsweise zur Anzeige zu bringen ist. 
Die Einfugung der Signalisierungsinf ormation erfolgt auch 

35 unabhangig von der aufieren From eines Videoobjektes. Diese 
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Signalisierungsinf ormation besteht aus dem Element „VOP 
coded" und ist so definiert, da£ der Wert O den Zustand 
„ nicht codiert u und der Wert 1 den Zustand „ codiert" 
signalisiert . Fur den Empfanger ist dabei zu definieren, da£ 
5 das entsprechende VO fur den Fall „VOP coded == O" zum 

Zeitpunkt, der durch die lokale Zeitbasis angegeben wird 
oder zum nachsten darauf f olgenden Zeitpunkt, zu dem beim 
Empfanger ein Bild zur Anzeige gebracht wird, nicht mehr 
angezeigt wird. Die Signal isierung mittels des Elementes 
10 ,/VOP width" wird im Gegensatz zur Realisierung gemafi Fig. l 

nicht mehr durchgef iihrt . 


Das Element "VOP coded" kann auch nach dem Element "VOP 
prediction type" in den Datenstrom eingefiigt werden. 

15 In Fig. 3 ist ein weiteres Ausf uhrungsbeispiels der 

Erfindung dargestellt. Die Signalisierungsinf ormation „VOP 
coded" wird nun direkt nach dem Element „VOP start code" 
plaziert, d.h. vor der lokalen Zeitbasisinf ormation „modulo 
time base" . Auch fur dieses Ausf uhrungsbei spiel wird die 

20 Signalisierung mittels des Elementes „VOP width" nicht mehr 

durchgeftihrt . Im Unterschied zum ersten Ausf uhrungsbei spiel 
(Fig. 2) mussen fur einen nicht codierten VOP noch weniger 
Daten iibertragen werden, da die lokale Zeitbasis nicht zu 
ubertragen werden braucht . Allerdings ist in diesem Falle 

25 das „Ausblenden" , d.h. das nicht mehr zur Anzeige bringen 

eines VOs, nicht mehr zu einem ganz speziellen Zeitpunkt 
moglich, sondern nur noch zum auf den Empfang des „nicht 
codierten" VOPs nachstf olgenden Zeitpunkt, zu dem beim 
Empfanger ein Bild zur Anzeige gebracht wird. 
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Anspriiche 

1. Verfahren zur Auf bereitung eines Datenstromes fur die 
objektbasierte Codierung von Bewegtbildf olgen fur 
Videoobj ekte , die beliebige Form und Gr6£e aufweisen, mit 
f olgenden Schritten : 

- Der eigent lichen Information uber das Videoobjekt wird 
eine lokale Zeitbasisinf ormation vorangestellt , 

vor oder nach dieser Zeitbasisinf ormation wird unabhangig 
von der auSeren Form eines Videoobj ektes stets eine 
Signalisierungsinf ormation in den Datenstrom eingefiigt, die 
angibt, ob das Videoobjekt fur eine Wiedergabe zu decodieren 
beziehungsweise zur Anzeige zu bringen ist. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, da£ 
die Signalisierungsinf ormation zwei Zustande fur ein 
Videoobjekt angibt, namlich den Zustand codiert und nicht 
codiert, wobei fiir den Zustand nicht codiert die Ubertragung 
der Information iiber das Videoobjekt abgebrochen wird und 
die Anzeige fur dieses Videoobjekt unterdruckt wird. 

3 . Verfahren nach Anspruch 1 oder 2 , dadurch 
gekennzeichnet, da£ fur Videoobj ekte , deren 
Signalisierungsinf ormation dem Zustand nicht codiert 
entspricht, das entsprechende Videoobjekt zu einem 
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Zeitpunkt, der durch die lokale Zeitbasisinf ormation 
bestimmt ist, nicht mehr zur Anzeige gebracht wird. 

4. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet , 
5 da£ fur Videoobjekte , deren Signal isierungsinf ormation dem 

Zustand nicht codiert entspricht, das entsprechende 
Videoobjekt zu dem auf den Zeitpunkt, der durch die lokale 
Zeitbasisinf ormation bestimmt ist, nachstf olgenden Zeitpunkt 
zu dem eine Anzeige erfolgen sollte, nicht mehr zur Anzeige 
10 gebracht wird. 
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